ISO/IEC 8859-6
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
ISO/IEC 8859-6은 아랍어를 지원하는 8비트 문자 인코딩 표준이다. 1986년 아랍 표준화 및 계량 기구(ASMO)가 ASMO 708로 처음 개발했으며, ECMA-114로 채택된 후 ISO 8859-6으로 국제 표준화 기구(ISO) 표준으로 승인되었다. 이 문자 집합은 양방향 텍스트를 지원하며, 아랍어 문자와 함께 라틴 문자와 숫자, 구두점을 포함한다. ISO/IEC 8859-6은 MS-DOS, Windows 등 다양한 운영체제 및 환경에서 사용되었으며, 여러 파생 인코딩 방식이 존재한다.
더 읽어볼만한 페이지
- ISO/IEC 8859 - ISO/IEC 8859-8
ISO/IEC 8859-8은 히브리어 텍스트 표현을 위해 설계된 ISO/IEC 8859 문자 인코딩의 일부로, 양방향 텍스트 지원 특징을 포함하며 RFC-1556에서 두 가지 변형을 정의한다. - ISO/IEC 8859 - ISO/IEC 8859-15
ISO/IEC 8859-15는 ISO 8859-1을 확장하여 유로 기호와 일부 유럽어 문자를 추가한 8비트 문자 인코딩 방식이지만, UTF-8로 대체되어 널리 사용되지는 못했다.
| ISO/IEC 8859-6 | |
|---|---|
| 일반 정보 | |
| 별칭 | iso-ir-127 ECMA-114 ASMO-708 arabic csISOLatinArabic |
| 이전 표준 | ASMO 449 |
| 다음 표준 | 유니코드 |
| 분류 | 확장 ASCII ISO 8859 |
| 확장 | OEM-708, 맥 OS 아라빅 (대부분) |
| 관련 표준 | Windows-1256 (비호환, 여러 문자 이동) |
| 표준 | ASMO 708, ECMA-114, ISO/IEC 8859-6 |
2. 역사
아랍 표준화 및 계량 기구(ASMO)[8]는 1986년에 아랍어 사용 국가에서 사용될 8비트 표준으로 ASMO 708을 고안하였다. 이 문자 집합은 이전 7비트 표준인 ASMO 449에서 영감을 받았지만, 몇 가지 차이점을 가진다.
ASMO 708은 원래 MS-DOS의 코드 페이지로 만들어졌으며, 상자 그림 문자 등 아랍어와 무관한 문자는 제외되었다.[18] ASMO 708은 다음과 같은 여러 문자 집합들과 관련이 있다.
ASMO 708은 ''양방향'' 문자 집합으로, 문맥(숫자가 라틴 문자인지 아랍 문자인지)에 따라 숫자는 라틴 숫자 또는 아랍 숫자로 렌더링된다. 또한 문맥에 따라 대칭 구두점은 스크립트 방향에 따라 반전된다.
ASMO 708은 ECMA와 긴밀히 협력하여[9] 설계되었으며, ECMA는 1986년 이를 자체 ECMA-114 표준으로 채택했다. 또한 '''ISO 8859-6'''으로 ISO 표준으로 승인되었고,[10] 1986년 코드화된 문자 집합 국제 등록에 '''IR 127'''[11]로 등록되었다.
3. 다른 문자 집합과의 관계
문자 표에는 독립형만 표기되어 있지만, 이 문자 코드로 작성된 텍스트를 표시하려면 아랍어 결합 처리가 필요하다. 또한, 샤클은 결합 문자로 처리해야 한다. 숫자는 ASCII 숫자만 정의되어 있다.
'''ISO_8859-6:1987''' (더 잘 알려진 MIME 이름은 '''ISO-8859-6''')는 이 규격을 논리적 순서로 사용하고, C0 (0x00–0x1F) 및 C1 (0x80–0x9F) 부분에 ISO/IEC 6429에서 온 제어 코드를 사용한 것으로 구성된 IANA 캐릭터 세트이다. (ISO/IEC 6429 및 ISO/IEC 2022에서 온) 이스케이프 시퀀스는 해석되지 않는다. 이 캐릭터 세트의 텍스트는 논리적 순서이므로, 표시에는 양방향 텍스트 처리가 필요하다. 이 캐릭터 세트에는 '''iso-ir-127''', '''ISO_8859-6''', '''ECMA-114''', '''ASMO-708''', '''Arabic''' 및 '''csISOLatinArabic'''라는 별칭이 있다.
ISO-8859-6 뒤에 -e 나 -i를 붙여 명시적 또는 암묵적으로 문자 방향을 지정한 버전도 존재한다[19]. ISO-8859-6-I는 암묵적인(논리적) 문자 방향을 가지며, ISO-8859-6-E는 제어 코드를 사용하여 명시적으로 문자 방향을 지정해야 한다. 아무것도 붙이지 않은 ISO-8859-6는 왼쪽에서 오른쪽으로 표시되도록 되어 있지만, 현실적으로 ISO-8859-6-E는 사용되지 않으며, ISO-8859-6는 ISO-8859-6-I와 마찬가지로 취급된다.
3. 1. ASMO 708/French 1
ASMO 708/French 1[12]은 프랑스어 소문자 문자를 추가한 것이다.
3. 2. French 1/ASMO 708
ISO 8859-1 코드 포인트에 프랑스어 소문자 문자를 추가하고 아랍어 문자를 '이동'시킨 버전이다.[12]
3. 3. ISO/IR 167
ISO/IR 167[13]는 프랑스어 및 독일어 문자를 추가한 버전이다.
3. 4. MS-DOS 코드 페이지 708
코드 페이지 708은 마이크로소프트의 MS-DOS용 코드 페이지로, 코드 페이지 437의 일반적인 코드 포인트에 프랑스어 문자를 추가하고 상자 그리기 문자를 추가한 것이다.[12]
3. 5. MS-DOS 코드 페이지 710 및 720
코드 페이지 710(투명 아랍어)과 코드 페이지 720(투명 ASMO)은 코드 페이지 437의 일반적인 코드 포인트에 프랑스어 문자를 추가하고, 코드 페이지 437의 상자 그리기 문자가 원래 코드 포인트에 있도록 아랍어 문자를 '이동'시킨 마이크로소프트의 MS-DOS용 코드 페이지이다.[12]
3. 6. Windows-1256
Windows 1256은 Windows 1252 코드 포인트에 프랑스어 소문자 문자를 추가하고 아랍어 문자를 '이동'시킨 마이크로소프트의 코드 페이지이다.[12]
4. 코드 차트
| ISO/IEC 8859-6[14][15][16][17] | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
| 0x | 미사용 | |||||||||||||||
| 1x | ||||||||||||||||
| 2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
| 5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \\ | ] | ^ | _ |
| 6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
| 7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ||